RNA

您所在的位置:网站首页 rna seq分析 RNA

RNA

#RNA| 来源: 网络整理| 查看: 265

GO(gene ontology)数据库,收集的是对各种物种基因功能进行限定和描述的标准词汇(term),是国际标准化的基因功能描述分类系统。根据基因产物的相关生物学过程( biological_process)、细胞组分(cellular_component)以及分子功能(molecular_function)三个大类分别给予定义,而每一大类下又包含更多层级具体term,这些定义与具体物种无关。

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合数据库,整合了基因组信息、化学信息和生化系统功能信息,目前包含了16个子数据库。比如,KEGG PATHWAY数据库包含了图解的细胞代谢、膜转运、信号传导等通路信息; KEGG GENES数据库、KEGG GENOME数据库则包含了部分或者完整序列的基因/基因组信息;KEGG Orthology(KO)是KEGG直系同源数据库,将各个KEGG注释系统联系在一起,将分子网络和基因组信息联系起来,根据直系同源关系,实现跨物种的基因组或转录组的功能注释。

GO功能分类

图示解析:

横坐标:GO三个基本分类(BiologicalProcess、CellularComponent、Molecular Function)以及各类的下一层级term,从中可以看到描述BP、CC或MF的具体term有哪些。通过该图对应的表格可以查找某一基因的具体功能信息。

纵坐标:注释到某一term(该term及其子term)的基因数目。

有向无环图

图示解析:

有向无环图(DAG图):GO数据库中,3大独立的ontology(BP、CC、MF)下面又可以独立出不同的亚层次,层层向下构成一个ontologies的树型分支结构,即有向无环图型。

RNA-seq中,对差异表达基因进行GO富集分析,采用topGO软件包实现有向无环图,展示差异基因富集的GO term及其层级关系,从上至下所定义的功能范围越来越具体。

对BP、CC、MF三大类各取富集程度最高的前10位作为DAG图主节点(方框表示),通过包含关系(is_a和part_of)将相关联的GO term一起展示,颜色越深代表富集程度越高,可以看出某一个term可以有多个箭头指向。比如 biological process term "hexose biosynthesis" 有两个parents:"hexose metabolism"和"monosaccharide biosynthesis",这是因为生物合成是代谢的一种,而己糖又是单糖的一种。

每一个节点(方框or椭圆),包含4行信息:GO term的id、该term的描述、GO富集的Corrected P-Value、该term下差异基因的数目/该term下基因组背景基因的数目。

散点图

图示解析:

RNA-seq中,对差异表达基因进行KEGG富集分析,可以通过散点图展示。此图中,KEGG富集程度通过Rich factor、qvalue和富集到此通路上的基因个数来衡量。

横坐标是Rich factor,数值越大表示富集程度越大。Rich factor=位于该pathway term下的差异表达基因数/位于该pathway term下的所有有注释基因数。

纵坐标是富集程度较高的pathway term(一般选取富集最显著的20条进行展示,不足20条则全部列出)。

q value是经过多重校验的p value,取值范围[0,1],以颜色表示,越红表示q value越小,说明富集越明显。

点的大小表示该term下差异基因的个数,点越大表示基因数越多。

KEGG通路图

图示解析:

RNA-seq中,KEGG通路图是将差异表达基因所处的通路信息进行展示。

对于有参考基因组的物种,转录组测序获得的差异基因构建KEGG通路图时可以选择物种特异性通路图(Organism-specificpathway map),物种相关的通路节点以绿色背景的方框表示。

节点(矩形框)代表某一基因、该基因编码的酶及这个酶参与的反应。框中的数字 是EC编号。网页版通路图分析结果中,点击该节点可以获得具体的信息(如下图)。550369是KEGG中的基因ID, T01004是物种标识符,然后是基因的名称,属于哪个KO分类以及表达的酶,对应的物种信息,参与哪些代谢途径,下面还有结构、序列信息等等。

红色边框表示该差异基因是上调的,绿色边框表示下调。上图展示的是有参转录组差异基因参与的类固醇生物合成途径。有时还会遇到黄色边框标注的,表示既有上调的也有下调的。粉色边框表示该节点是有差异的,但不区分具体上、下调。

对于没有基因组序列的物种,选择无参转录组测序,此时构建KEGG通路图选择的是 KO Reference pathway,不区分具体物种信息,节点以蓝色背景标注(如下图)。

KEGG通路图中各种符号的含义:



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3